深度强化学习强化学习

DeepSeek-R1
帮你解答

登录百度帐号交易更有保障

登录百度帐号认准标，百度为您提供权益保障

查看《保障服务协议》与免保范围

发生欺诈？申请保障

加入商家保障获得标

立即登录

登录

热搜榜民生榜财经榜

13美财长：对中国145%关税无法长期维持

14电梯大王25亿元股权由配偶一人继承

15东盟十国与中日韩联合声明剑指美国热

收起工具时间不限所有网页和文件站点内检索

搜索工具

百度为您找到以下结果

深度学习教程-深度学习教程系列教程

本课程以神经网络为主线,介绍网络结构、泛化能力、数学基础以及神经网络在解偏微分方程和科学问题中的一些应用.

玻尔科研空间站 2025-05广告

深度强化学习 - 百度百科

深度强化学习将深度学习的感知能力和强化学习的决策能力相结合，可以直接根据输入的图像进行控制，是一种更接近人类思维方式的人工智能方法。详情

百度百科

深度强化学习强化学习的最新相关信息

以优良作风凝心聚力、干事创业

连日来，各中央企业教育引导党员干部把学习教育与中心工作结合起来，确保学习教育取得实实在在的成效。中国航天科技集团党组提出“约束是底线、自觉是目标”的工作要求，形成...

人民日报7小时前

播报

暂停

边学边练,推理觉醒:LUFFY让强化学习即学即用!

这就好比AI 模型训练中长期存在的两种极端:「模仿学习」只顾照搬示范却缺乏自我实践,「强化学习」一味自我探索却不借鉴现有经...

新浪昨天11:41

播报

暂停

用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源

强化学习突破多模态感知极限|开源于恩投稿量子位 | 公众号 QbitAI 超越YOLOv3、Faster-RCNN,首个在COCO2017 val set上突破30AP的纯多模态开源LLM来啦! 华中科技大学、北京...

新浪新闻3天前

播报

暂停

强化学习和深度学习

2024年11月24日 强化学习(Reinforcement Learning, RL)和深度学习(Deep Learning, DL)是人工智能领域的两个重要分支,二者既有显著差异,又在实际应用中常结合使用。强化学习侧...

深度强化学习(Deep Reinforcement Learning, DRL)-CSDN博客

2025年3月24日近端策略优化(PPO):通过限制策略更新的幅度,提高学习稳定性,是当前常用的强化学习算法。深度确定性策略梯度(DDPG):适用于连续控制任务的强化学习方法。 3.深...

播报

暂停

【AI前沿】深度学习基础:深度强化学习-CSDN博客

2024年7月13日 深度强化学习(Deep Reinforcement Learning,DRL)是人工智能(AI)研究的一个重要方向,结合了深度学习(Deep Learning)和强化学习(Reinforcement Learning)的优势。通过深度强化...

播报

暂停

强化学习(学习方法) - 百度百科

Deep Q-Network（DQN）：DQN是一种结合了深度学习和强化学习（特别是Q-learning）的算法，它通过使用深度神经网络来近似Q值函数，从而能够处理具有高维状态空间的问题。DQN维护两个相同的神经网络：一个是用于决策的在线网络，另一个是用于计算目标Q值的目标...

定义发展历史基本原理应用相关研究与发展

播报

暂停

深度强化学习强化学习 - 相关论文(共25750篇) - 百度学术

深度强化学习综述简

刘全 - 计算机学报 - 2018 - 被引:41

深度强化学习是人工智能领域的一个新的研究热点.它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合,并能够通过端对端的学习方式实现从原始输入到输...

被引:7深度强化学习在视频游戏中的应用华南理工大学

被引:0多智能体深度强化学习研究进展计算机学报

被引:0面向电网前瞻调度嵌入领域知识的深度强化学习方法电网技术

查看更多相关论文 >

百度学术

深度强化学习和强化学习的区别

强化学习:由于不需要训练深度神经网络,算法相对简单且易于实现。 深度强化学习:需要训练深度神经网络,算法复杂度较高,对计算资源和时间的需求也更大。应用场景强化学习:适...

深度学习与强化学习

2023年12月27日 深度强化学习（DRL）是深度学习与强化学习的结合，在其中，深度学习主要用于对状态空间和动作空间的表示和学习，而强化学习主要用于对目标任务的优化。DRL已经在一系列复杂...

播报

暂停

【深度学习】强化学习(五)深度强化学习-腾讯云开发者社区-...

2024年7月30日强化学习旨在通过智能体与环境交互学习最优策略以最大化累积奖励,涉及状态、动作、策略等要素,马尔可夫决策过程描述其交互,深度强化学习结合二者应对复杂情况,虽有挑战但前景...

播报

暂停

12 3 4 5 6 7 8 9 10 下一页 >

帮助举报用户反馈企业推广